10 research outputs found

    Privacy-preserving distributed data mining

    Get PDF
    This thesis is concerned with privacy-preserving distributed data mining algorithms. The main challenges in this setting are inference attacks and the formation of collusion groups. The inference problem is the reconstruction of sensitive data by attackers from non-sensitive sources, such as intermediate results, exchanged messages, or public information. Moreover, in a distributed scenario, malicious insiders can organize collusion groups to deploy more effective inference attacks. This thesis shows that existing privacy measures do not adequately protect privacy against inference and collusion. Therefore, in this thesis, new measures based on information theory are developed to overcome the identiffied limitations. Furthermore, a new distributed data clustering algorithm is presented. The clustering approach is based on a kernel density estimates approximation that generates a controlled amount of ambiguity in the density estimates and provides privacy to original data. Besides, this thesis also introduces the first privacy-preserving algorithms for frequent pattern discovery in a distributed time series. Time series are transformed into a set of n-dimensional data points and finding frequent patterns reduced to finding local maxima in the n-dimensional density space. The proposed algorithms are linear in the size of the dataset with low communication costs, validated by experimental evaluation using different datasets.Diese Arbeit befasst sich mit vertraulichkeitsbewahrendem Data Mining in verteilten Umgebungen mit Schwerpunkt auf ausgewählten N-Agenten-Angriffsszenarien für das Inferenzproblem im Data-Clustering und der Zeitreihenanalyse. Dabei handelt es sich um Angriffe von einzelnen oder Teilgruppen von Agenten innerhalb einer verteilten Data Mining-Gruppe oder von einem einzelnen Agenten außerhalb dieser Gruppe. Zunächst werden in dieser Arbeit zwei neue Privacy-Maße vorgestellt, die im Gegensatz zu bislang existierenden, die im verteilten Data Mining allgemein geforderte Eigenschaften zur Vertraulichkeitsbewahrung erfüllen und bei denen sich der gemessene Grad der Vertraulichkeit auf die verwendete Datenanalysemethode und die Anzahl von Angreifern bezieht. Für den Zweck eines vertraulichkeitsbewahrenden, verteilten Data-Clustering wird ein neues Kernel-Dichteabschätzungsbasiertes Verfahren namens KDECS vorgestellt. KDECS verwendet eine Approximation der originalen, lokalen Kernel-Dichteschätzung, so dass die ursprünglichen Daten anderer Agenten in der Data Mining-Gruppe mit einer höheren Wahrscheinlichkeit als einem hierfür vorgegebenen Wert nicht mehr zu rekonstruieren sind. Das Verfahren ist nachweislich sicherer als Data-Clustering mit generativen Mixture Modellen und SMC-basiert sicherem k-means Data-Clustering. Zusätzlich stellen wir neue Verfahren, namens DPD-TS, DPD-HE und DPDFS, für eine vertraulichkeitsbewahrende, verteilte Mustererkennung in Zeitreihen vor, deren Komplexität und Sicherheitsgrad wir mit den zuvor erwähnten neuen Privacy-Maßen analysieren. Dabei hängt ein von einzelnen Agenten einer Data Mining-Gruppe jeweils vorgegebener, minimaler Sicherheitsgrad von DPD-TS und DPD-FS nur von der Dimensionsreduktion der Zeitreihenwerte und ihrer Diskretisierung ab und kann leicht überprüft werden. Einen noch besseren Schutz von sensiblen Daten bietet das Verfahren DPD HE mit Hilfe von homomorpher Verschlüsselung. Neben der theoretischen Analyse wurden die experimentellen Leistungsbewertungen der entwickelten Verfahren mit verschiedenen, öffentlich verfügbaren Datensätzen durchgeführt

    Técnicas de mineração de dados: um estudo de caso da evasão no ensino superior do Instituto Federal do Maranhão

    Get PDF
    Este trabalho mostra que é possível extrair conhecimento útil de dados puros sobre os estudantes de graduação IFMA, de modo a tentar entender os problemas de evasão do referido instituto. Neste artigo, o conhecimento foi modelado como um classificador capaz de identificar quais alunos são os mais propensos a abandonar o curso. Foram usado três algoritmos: Naive Bayes, Support Vector Machine e J48. Assim, baseados no entendimento do problema é possível tomar medidas na tentativa de reduzir essa evasão, como por exemplo, tentar auxiliar o possível aluno evasor antes que isso aconteça, aumentando assim o número de estudantes que se formam

    ESTUDANDO EQUAÇÃO DO 1o GRAU POR MEIO DO USO DE FONTES HISTÓRICAS: O PAPIRO DE RHIND

    Get PDF
    Desde a criação dos Parâmetros Curriculares Nacionais na década de 90 do século passado, têm sido criadas várias discussões em relação à utilização das Tendências da Educação Matemática. Uma destas discussões é que muitos dos atuais professores da Educação Básica não estão preparados para fazer uso destas técnicas de aprendizagem. No entanto, este fato se mostra mais perceptível quando a tendência em questão é a História da Matemática. Então, com o intuito de providenciar uma maior instrução para a utilização deste recurso, propomos uma opção de aula sobre o conteúdo de Equações do 1o grau com base em uma abordagem histórica. Para isto, foi utilizado um documento egípcio antigo, conhecido como Papiro de Rhind, que é uma importante fonte de conhecimento matemático e que pode ser utilizado para ensinar diversos conteúdos. Através deste papiro foi introduzido o método da Falsa Posição, que está diretamente ligado aos primeiros indícios do uso do conceito de Equações do 1o grau. A partir da introdução do método, discutimos com os discentes a melhor maneira de se utilizar o método e se ele é um método válido para o aprendizado do conteúdo. Assim, foi visto que o método proporciona ao aluno uma forma diferente de resolver questões relacionadas às Equações do 1o grau, dispondo de uma forma diferente daquela ensinada pelos professores na atualidade. Deste modo, percebemos que é possível inovar nas aulas tradicionais de matemática, dando ao aluno diversas opções para o desenvolvimento de seu aprendizado e propiciando um ambiente de discussão em que o conhecimento poderá ser construído com a participação de todos

    O imaginário do professor na organização de material didático e no uso de metodologias de Língua Portuguesa no ensino remoto

    Get PDF
    O presente artigo objetiva relatar uma investigação sobre a importância da imagem que o professor tem de si e do aluno para organização de material didático e uso de metodologias no ensino remoto. Para Bakhtin (2016[1979]), o sujeito se constrói na relação de alteridade entre o eu e o outro. Compreender a si mesmo, o outro e o mundo é sempre uma compreensão responsiva. Amossy (2016) destaca que o ato de se expressar, de agir discursivamente implica a construção de uma imagem de si. A relação dialógica imbrica-se diretamente com a noção de trajeto antropológico de Gilbert Durand (2019) e o processo de construção do imaginário, no qual o sujeito compreende sua própria constituição através da relação entre o biopsíquico e cósmico-social. Sartre (2019) discute o conceito de imaginário a partir de vários pontos de encontro com a teoria dialógica, dentre eles destacamos, a noção de alteridade, intersubjetividade e inacabamento.  Metodologicamente, a pesquisa está dividida em duas partes: a primeira, de caráter bibliográfico, exploratório-descritivo, a segunda, dedicada à pesquisa de campo enquanto na escola Municipal Nilza Coelho Lima, no município São Bernardo – MA. Os dados revelam que a imagem que o professor tem de si mesmo e dos alunos é determinante para a elaboração de material didático e uso de metodologias que atendam às necessidades contextuais dos alunos. Destacamos que o envolvimento afetivo, de confiança do professor para com os alunos foi fator fundamental no engajamento e interação da turma em atividades realizadas por aplicativos e plataformas virtuais

    O IMAGINÁRIO E SUAS REPRESENTAÇÕES EM ALGUNS MITOS E LENDAS DO BAIXO PARNAÍBA MARANHENSE

    Get PDF
    Este artigo tem como objetivo apresentar uma pesquisa sobre o imaginário e suas representações na cultura popular do Baixo Parnaíba Maranhense. Trata-se de uma pesquisa bibliográfica, de caráter exploratório-descritiva, na qual nos debruçamos em materiais bibliográficos sobre o tema (artigos, livros, dissertações, relatórios de pesquisa, entre outros). Como referencial teórico, destacam-se, neste trabalho, autores como Gilbert Durand (1997), Gaston Bachelard (2002), Carl Jung (2008), Mircea Eliade (1991), Sartre (2008), entre outros. Desta forma, no primeiro capítulo, buscaremos apresentar um pouco sobre os conceitos de mitos e lendas, buscando esclarecer sobre estas concepções conceituais, que muitas vezes caem no senso comum, mas que podem contribuir bastante para a compreensão do ser humano no sentido antropológico. No segundo capítulo, iremos frisar a importância do imaginário, apresentando o que é este conhecimento e como ele pode contribuir para a compreensão do ser humano, nos ligando com o conhecimento dos antepassados que ainda habitam as profundezas de nossa consciência. No terceiro e último capítulo, iremos apresentar os resultados de uma pesquisa de campo realizada com os membros do grupo de estudos e pesquisa GEPEMADEC (Grupo de Estudos e Pesquisas em Meio Ambiente, Desenvolvimento e Cultura) no período de 2016-2017, onde foi realizado um questionário sobre os mitos e lendas do Baixo Parnaíba Maranhense com os habitantes desta região, com os dados obtidos, pudemos fazer algumas considerações sobre a cultura popular local

    CONHECIMENTO BOTÂNICO LOCAL SOBRE CACTÁCEAS: UM ESTUDO DE CASO NO MUNICÍPIO DE BOQUEIRÃO, PARAÍBA, NORDESTE DO BRASIL

    Get PDF
    O presente estudo registrou o conhecimento botânico local dos moradores da comunidade rural Moita, município de Boqueirão, com relação à família Cactaceae. Na coleta de dados etnobotânicos foram realizadas entrevistas semiestruturadas com 46 pessoas (12 homens e 34 mulheres). Sete espécies foram registradas: Pilosocereus pachycladus F. Ritter subsp. pernambucoensis (F. Ritter) Zappi, Melocactus sp., Pilosocereus gounellei (F.A.C. Weber) Byles & G.D. Rowley subsp. gounellei, Opuntia ficus-indica (L.) Mill., Cereus jamacaru DC. subsp. jamacaru, Tacinga palmadora (Britton & Rose) N.P.Taylor & Stuppy e Tacinga inamoena (K. Schum.) N.P. Taylor & Stuppy, pertencentes a cinco gêneros. Um total de 342 citações de uso foi registrado, sendo distribuídas em dez categorias de uso: alimento, combustível, construção forragem, mágico religioso, medicinal, ornamental, sombra, tecnologia e veterinário. P. pachycladus subsp. pernambucoensis obteve o maior número de citações (42,10%) e a categoria de uso proeminente foi alimento (146 citações). A partir das citações e categorias de uso atribuídas às várias espécies é notável a importância que os cactos possuem para os moradores da comunidade estudada.Palavras chave: cactos, etnobotânica, população tradicional

    Knowledge acquisition and maintenance for a society of artificial guardians.

    No full text
    Neste trabalho, abordamos os problemas relacionados com a aquisição de conhecimento para uma sociedade de agentes tutores artificiais, no âmbito do projeto MA-THEMA. Neste sentido, propomos um ciclo de aquisição de conhecimento para a construção de agentes tutores inteligentes e apresentamos a especificação de um ambiente de manutenção que da suporte a este ciclo. Em relação a esse ambiente, definimos sua arquitetura e as funcionalidades de seus elementos. Em particular, definimos os protocolos de interação entre esse ambiente e a sociedade de agentes. Apresentamos ainda um protótipo que implementa a especificação do ambiente de manutenção proposta.In this work we address issues related to the knowledge acquisition for a society of artificial tutoring agents within MATHEMA Project. We present here a Knowledge Acquisition cycle for building tutoring agents and a specification for the maintenance environment that support this cycle. Regarding this environment we have defined its architecture and functionality of its elements. In particular, we solved issues related to interaction protocols between this maintenance environment and the tutoring agents and we developed a prototype implementing this environment

    Inference in Distributed Data Clustering Abstract

    No full text
    In this paper we address confidentiality issues in distributed data clustering, particularly the inference problem. We present KDEC-S algorithm for distributed data clustering, which is shown to provide mining results while preserving confidentiality of original data. We also present a confidentiality framework with which we can state the confidentiality level of KDEC-S. The underlying idea of KDEC-S is to use an approximation of density estimation such that the original data cannot be reconstructed to a given extent. Key words: Privacy-preserving data mining, distributed data mining, data clustering, inference problem.

    Aprendizado de Máquina Aplicado à Análise de Evasão no Ensino Superior

    No full text
    Evasão estudantil é um problema importante e presente em todos os contextos educacionais, causando grandes prejuízos ao aluno, à sociedade e ao país. Para combatê-lo, é preciso inicialmente descobrir quais discentes são mais propensos a evadir. A fim de lidar com esta dificuldade, neste trabalho, busca-se, por meio da aplicação de técnicas de Aprendizado de Máquina, identificar qual o perfil do aluno evasor. Para tanto, foram aplicados três algoritmos de aprendizagem em uma base de dados com informções de alunos de uma Instituição de Ensino Superior do Brasil. Os resultados dos experimentos aqui conduzidos no contexto de classificação foram analisados e discutidos, indicando o potencial da utilização de Aprendizado de Máquina na identificação de possíveis alunos evasores
    corecore